應用機率式句法結構與隱含式語意索引於情緒語音合成之單元選取 (Unit Selection for Corpus-Based Emotional Speech Synthesis Using PCFG and LSI) [In Chinese]

نویسندگان

Jiun-Fu Chen

Chi-Chun Hsia

Chung-Hsien Wu

چکیده

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Semantic Associative Topic Models for Information Retrieval

主題模型(topic model)被廣泛地應用在各種文件建模以及語音識別、資訊檢索和本文探勘系統中,有效地擷取文件或字詞的語意和統計資料。大多數主題模式,例如機率潛在語意分析(probabilistic latent semantic analysis) 和潛在狄利克里分配 (latent Dirichlet allocation),主要都透過一組潛藏的主題機率分布來描述文件與字詞之間的關係,並用以擷取文件的潛在語意資訊。然而,傳統的主題模型受限於詞袋(bag-of-words)的假設,其潛藏主題僅能用來擷取個體詞(individual word)之間的語意資訊。雖然個體詞可傳達主題信息,但有時會缺乏本文準確的語意知識,容易造成文件的誤判,降低檢索的品質。為了改善主題模型的缺點,本論文提出一種新穎的語意關聯主題模型(semantic associ...

متن کامل

整合邊際資訊於鑑別式聲學模型訓練方法之比較研究 (A Comparative Study on Margin-Based Discriminative Training of Acoustic Models) [In Chinese]

鑑別式聲學模型訓練在近代自動語音辨識(Automatic Speech Recognition, ASR)中扮演重要的角色。在許多基於不同思維且能有效地提昇辨識率的鑑別式聲學模型訓練方法陸續被提出後,對於訓練方法的相關推廣與改進便如雨後春筍般地興起;而這些方法在本質上,皆是在描述訓練語句與語音辨識器所產生對應詞圖(Word Graph)之間的關係。本論文首先將統整與歸納近年來所發展的多種鑑別式聲學模型訓練方法,並以三種最具代表性鑑別式訓練方法:最小化分類錯誤(Minimum Classification Error, MCE)、最大化交互資訊(Maximum Mutual Information, MMI)、最小化音素錯誤(Minimum Phone Error, MPE)為範例,透過有系統地轉換與化解方程式,得到聲學模型訓練準則的共通表示函數型態。我們可以發現到,對於...

متن کامل

多語聲學單位分類之最佳化研究 (The Study of Acoustic Model Clustering in Multilingual Speech Recognition) [In Chinese]

由於全球化的形成,人與人之間的溝通不再限於同一種語言,因此多語的語音辨識也變的格外的重要。如何有效整合多語的聲學模型是一個關鍵議題,因為一組好的多語聲學單位將影響辨識結果。本論文提出了一套整合專家背景知識與實際語音分析的方法,來產生一組新的聲學單位,並且對這組聲學單位的數目,使用差分貝式資訊法則來做最佳的處理。從訓練好的隱藏式馬可夫聲學模型中,計算其單位間的相似度矩陣,之後透過語音學和音韻學的知識,限定了各個聲學單位能群化的上限,根據不同限定的群化上限,使用聚合階層式分群法,來建立不同的結構樹。之後,利用差分貝式資訊法則,將每個結構樹中發音相近的聲學單位做合併,當差分貝式資訊法則的值小於零的時候,就停止合併,而新合併成一群的聲學單位則為新的聲學單。我們將用 ForSDAT01 華台雙語語料庫來實驗評量,而實驗結果顯示,本論文所提出的新方法比只用專家知識所定義的聲學...

متن کامل

完全基於類神經網路之語音合成系統初步研究 (A Preliminary Study on Fully Neural Network-based Speech Synthesis System) [In Chinese]

A Preliminary Study on Fully Neural Network-based Speech Synthesis System 廖書漢 SHU-HAN Liao ,蔡亞伯 YaBo Chai , 廖元甫 a Yuan-Fu Liao, a 國立台北科技大學電子工程系 [email protected], [email protected], [email protected] 摘要傳統的語音合成使用先文字分析後語音合成的架構,但是這種兩階段的作法, 通常會有,若前級分析錯誤,就會影響後級合成,且無法挽救的問題。因此,在本論文中我們希望嘗試把前後級,全部都改成以類神經網路實現,以便將來可以直接合成一個大的端對端語音合成類神經網路。主要的想法是,直接以字元串為輸入單位,並盡量用大量未標記語料,進行非監督式類神經網路訓練。我們的系統包含四個子網路,分...

متن کامل

利用聲學與文脈分析於多語語音辨識單元之產生 (Generation of Phonetic Units for Multilingual Speech Recognition Based on Acoustic and Contextual Analysis) [In Chinese]

摘要由於全球化趨勢之盛行,多語語音常出現於會議紀錄及一般對話等方面。對於會議紀錄及對話系統而言,多語語音自動辨識日顯重要。在多語語音自動辨識中,辨識單元集之定義及選取,將影響辨識之效率及效能。本論文針對中英文利用 IPA 定義之多語語音辨識單元集,考慮前後文相關之三連音模型,並進一步透過對聲學相似度與前後文脈分析,決定一組精簡有效的多語辨識單元。在相似度矩陣分析中,首先我們利用事後機率統計,建立聲學相似度矩陣,然後,基於發音共聲現象的考量,分析語音發音上之相似度。本論文更引入語言超空間相似度之觀念,計算三連音辨識單元前後文脈之關係,建立語言超空間相似度矩陣。最後利用資料融合技術,合併聲學相似度矩陣和語言超空間相似度矩陣,以計算三連音辨識單元間之距離,而後利用向量量化群集方法合併相似性高之三連音辨識單元,建立一個有效的多語語音辨識單元集。本論文以 EAT 中英雙語語料...

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2004

應用機率式句法結構與隱含式語意索引於情緒語音合成之單元選取 (Unit Selection for Corpus-Based Emotional Speech Synthesis Using PCFG and LSI) [In Chinese]

نویسندگان

چکیده

منابع مشابه

Semantic Associative Topic Models for Information Retrieval

整合邊際資訊於鑑別式聲學模型訓練方法之比較研究 (A Comparative Study on Margin-Based Discriminative Training of Acoustic Models) [In Chinese]

多語聲學單位分類之最佳化研究 (The Study of Acoustic Model Clustering in Multilingual Speech Recognition) [In Chinese]

完全基於類神經網路之語音合成系統初步研究 (A Preliminary Study on Fully Neural Network-based Speech Synthesis System) [In Chinese]

利用聲學與文脈分析於多語語音辨識單元之產生 (Generation of Phonetic Units for Multilingual Speech Recognition Based on Acoustic and Contextual Analysis) [In Chinese]

عنوان ژورنال:

اشتراک گذاری